Search results for "programación dinámica"
showing 2 items of 2 documents
Aprendizaje por refuerzo en espacios continuos: algoritmos y aplicación al tratamiento de la anemia renal
2014
El aprendizaje por refuerzo es un paradigma de aprendizaje automático orientado a la resolución de problemas de decisión secuenciales. Este tipo de problemas aparece en aplicaciones pertenecientes a campos tan diversos como control automático, medicina, investigación operativa o economía. Los algoritmos clásicos de aprendizaje por refuerzo están fundamentados en la teoría matemática de la programación dinámica, donde se asume que el espacio de estados es discreto y se compone de un número manejable de estados. Desafortunadamente, en la mayoría de aplicaciones de interés práctico el espacio de estados es continuo, por lo que los algoritmos clásicos dejan de ser útiles. Para poder aplicar el …
Estabilización de modelos económicos dinámicos con control óptimo en tiempo continuo
1990
En esta Tesis de Licenciatura se lleva a cabo el estudio de un problema determinado de optimización dinámica y sus aplicaciones en el campo de la Ciencia Económica. Un problema de optimización consiste, fundamentalmente, en la búsqueda de un extremo de una función o un funcional objetivo que proporcione un máximo o un mínimo para esa función. Cuando se habla de optimización dinámica hay que incorporar el factor tiempo al problema, en todas y cada una de las diferentes variables que intervienen, lo que afectará a los modelos matemáticos que se empleen para representar el comportamiento y las relaciones existentes entre dichas variables. También afecta al funcional objetivo a optimizar. Así, …